查看原文
其他

ToppCell Atlas:单细胞分析中针对细胞类型的富集分析

生信技能树 生信技能树 2022-08-13


希望所有的学徒,实习生,学员都能在生信技能树的舞台上绽放自己的光彩!

下面是粉丝(队长_是我)的随机投稿

Welcome to ToppGene (cchmc.org)

这是一个神奇的网站,除了常规的基因富集分析,还能进行细胞类型的富集分析。

在做单细胞分析中,进行细胞分类时,偶尔会出现一些奇怪的亚群。

如图中箭头所指,内皮细胞被分成了两个群。我们想知道他们为何被分成两群。首先拿到两群各自的高表达基因。

Idents(sce) = sce$seurat_clusters
degs = FindMarkers(sce, ident.1 = 13)
degs %>% 
  arrange(desc(avg_log2FC)) %>% 
  rownames_to_column('gene') %>% 
  fwrite('./cl13_degs.csv')

degs = FindMarkers(sce, ident.1 = 4)
degs %>% 
  arrange(desc(avg_log2FC)) %>% 
  rownames_to_column('gene') %>% 
  fwrite('./cl4_degs.csv')

高表达基因如下:

C13:

CCL21  TFF3  MMRN1  FABP4  TFPI  IGFBP7  TIMP3  TM4SF1  SDPR  EFEMP1  CAV1  CLDN5  FLT4  ROBO4  ECSCR  NR2F2  APP  PGM5  THBD  RAMP2  CD9  TIE1  APOLD1  FXYD6  CD59  LMO2  TGFBR2  PROX1  OAF  SHC1  SPTBN1  TBX1  TRIOBP  NR2F1  AKAP12  ITGB4  PPFIBP1  NRP2  EMP1  ELK3

C4:

ACKR1  AQP1  VWF  PLVAP  SPARCL1  CLU  ADIRF  IGFBP7  SPRY1  PECAM1  RAMP3  IGFBP4  NPDC1  HSPG2  EPAS1  HEG1  EMCN  LIFR  A2M  CAV1  IFI27  ADGRL4  ENG  TSPAN7  CD34  HYAL2  COL15A1  RAMP2  EDN1  CLEC14A  MMRN2  PTRF  CRIP2  EGFL7  PTPRB  ECSCR  CD59  APOLD1  IL1R1  ESAM

拿到高表达基因后,进入下面这个网站进行富集分析:

Welcome to ToppGene (cchmc.org)

这里我选取了前40个基因去进行富集分析,得到结果如下:

C13:

根据ToppCell Atlas

可知13群为淋巴管内皮细胞(lymphatic endothelial cells, LEC

C4:

4群为血管内皮细胞(endothelial cells)

除此之外,图中21群被注释为Tissue_stem_cell。我也想看看它的真实身份是什么。继续上面的流程,得到:

NOTCH3  TAGLN  ACTA2  C11ORF96  MYL9  IGFBP5  MCAM  MYH11  IGFBP7  TPM2  MYLK  SPARCL1  MT1E  COL18A1  CALD1  RGS5  SPARC  ADIRF  TINAGL1  PDGFRB  BGN  MFGE8  NR2F2  NDUFA4L2  TPM1  COL4A2  MAP1B  CPE  EPAS1  TIMP3  CAV1  A2M  MT1M  ADAMTS1  COL6A1  COL6A2  COL4A1  MT1A  SOD3  TBX2

根据富集的信息

可知21群周细胞或者平滑肌细胞


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存